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CAPiTULO 1 



SISTEMAS DE ECUACIONES 



El problema central del algebra lineal es la solucion de sistemas de ecuaciones lineales. Una ecua- 
cion lineal tiene la forma a\X\ + 02X2 + • • • + a n x n = b donde los Xj son incognitas y b y los ctj son 
escalares constantes. Una solucion de esta ecuacion es un conjunto de valores de las incognitas Xj 
que satisface la igualdad. 

Un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales {ei, e%, ■ ■ ■ , e m } y su so- 
lucion es la interseccion de las soluciones individuales de cada una de las ecuaciones. Si la inter- 
seccion es vacia entonces el sistema no tiene solucion. 

Dos sistemas de ecuaciones son equivalentes si tienen el mismo conjunto solucion. 

Cuando un sistema tiene solucion se dice que es compatible. Si la solucion es unica entonces es 
determinado. Si el numero de soluciones es infinito entonces es indeterminado. 

Cuando un sistema no tiene solucion se dice que es incompatible. 

El caso mas importante y simple ocurre cuando el numero de incognitas es igual al numero de 
ecuaciones. Existen dos metodos bien definidos para resolver este problema. El primero es la eli- 
minacidn gaussiana, en la cual multiplos de la primera ecuacion se restan de las otras ecuaciones, 
lo cual deja un sistema mas pequeno con n — 1 ecuaciones y n — 1 incognitas. El proceso se repite 
hasta que quede una sola ecuacion y una sola incognita, la cual puede ser resuelta de inmediato; 
luego resulta facil ir hacia atras y encontrar las otras incognitas en orden inverso. El segundo me- 
todo introduce el concepto de determinante. Existe una formula exacta llamada regla de Cramer, la 
cual permite resolver cada incognita como el cociente de dos determinantes. 

En la practica, la regla de Cramer es un desastre y la eliminacion es el algoritmo utilizado cons- 
tantemente para resolver sistemas grandes de ecuaciones. 



1.1. Geometria de los Sistemas Lineales 

Considerese el sistema de ecuaciones: 

2x + 3y = 8 
4x — 5y = —6 

1.1.1. Vision Geometrica 1. La primera vision geometrica esta basada en las filas. Cada ecua- 
cion representa una recta. Resolver el sistema consiste en encontrar la interseccion de todas las 
rectas. 
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1.2. ELIMINACION GAUSSIANA 
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1.1.2. Vision Geometrica 2. El segundo enfoque se concentra en las columnas del sistema. 
Las dos ecuaciones son realmente una ecuacion vectorial: 



2 




3 




8 


4 


+ y 


-5 




-6 



Resolver el sistema consiste en encontrar la combinacion lineal de los vectores columna al lado 
izquierdo que produce el vector al lado derecho. 

1.2. Eliminacion Gaussiana 

La eliminacion gaussiana pretende, partiendo de un sistema, llegar a un sistema equivalente don- 
de encontrar la solucion utilizando un esquema de sustitucion hacia atras sea bien sencillo. 

La eliminacion gaussiana se basa en en los siguientes teoremas:: 
Teorema. Teorema Fundamental de Sistemas. 



S= < 



ei 
ek- 



es equivalente a S' = < 



ei 
e2 



si a k / 0. 



La fc-esima fila del sistema fue sustituida por una combinacion lineal de las demas filas. 

Teorema. Un sistema S y el sistema S' que resulta de intercambiar dos filas cualesquiera de S son 
equivalentes. 

1.2.1. Pivotes. Se denomina pivote al primer elemento distinto de cero en una fila despues 
de realizar el proceso de escalerizacion. Los pivotes tienen las siguientes caracteristicas: 

1. Debajo de un pivote hay ceros. 

2. Todo pivote de una fila esta a la derecha del pivote de la fila anterior. 



CAPiTULO 2 



MATRICES 



Una matriz es un arreglo rectangular de numeros . Las lmeas horizontales de una matriz se de- 
nominan filas y las verticales columnas. Una matriz con m filas y n columnas es referida como una 
matriz demxnfm por n). Por ejemplo, la siguiente es una matriz de 4 x 3: 

~ 2 2 5 " 
-1 1 -2 
3 2-3 
5-8 0 

El elemento de una matriz A ubicado en la fila i y la columna j se suele denotar Ay o aij. 

2.1. Suma de Matrices 

La suma de dos matrices A y B esta definida solo si ambas tienen el mismo numero de filas y 
columnas. 

DEFINICION. Si A y B son matrices demxn, entonces su suma A + B es una matriz m x n dada 
por 

(A + B)ij = aij + bij 

para cada par i y j. 

2.2. Producto de un escalar y una matriz 

DEFINICION. Si c es un escalar y A es una matriz de m x n entonces el producto cA es una matriz 
demxn dada por 

(cA)ij = cciij 

para todo par 

2.3. Producto Matricial 

El producto de dos matrices A y B esta definido si el numero de columnas de A es igual al numero 
de filas de B. 

DEFINICION. Si A es una matriz demxpyBes una matriz depxn, entonces su producto AB es 
una matriz demxn dada por 

v 

(AB)ij = a ikbkj 
k=i 

para cada par i y j. 

En nuestro caso, a menos que se indique lo contrario, se tratara de numeros reales. Mas generalmente, los elemen- 
tos de una matriz pueden ser miembros de un anillo. 
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2.4. NOTACION MATRICIAL DE SISTEMAS DE ECUACIONES LINEALES 8 

Esta nocion de multiplicacion es importante porque define la multiplicacion por una matriz como 
una transformacion lineal y el producto de dos matrices como la composicion de dos transforma- 
ciones lineales. 

La multiplicacion de matrices es: 

■ Asociativa: (AB)C = A(BC) 

• Distributiva: A(B + C) = AB + AC, (A + B)C = AC + BC 
En general, la multiplicacion de matrices no es conmutativa: AB ^ BA 
El producto AB de dos matrices puede verse de varias maneras: 

1. Cada elemento de AB es el producto de una fila y una columna: 

(AB)ij = A,. IS., 

2. Cada columna de AB es el producto de una matriz y una columna: 

(AB).j = AB.j 

Notese que el producto de A y una columna de B puede interpretarse como una com- 
binacion lineal de las columnas de A utilizando como coeficientes las coordenadas del 
vector columna de B considerado. 

3. Cada fila de AB es el producto de una fila y una matriz: 

(AB);. = A,,B 

Notese que el producto una fila de A y la matriz B puede interpretarse como una combi- 
nacion lineal de las filas de B utilizando como coeficientes las coordenadas del vector fila 
de A considerado. 

4. AB puede verse como la suma de las matrices resultantes de multiplicar columnas y filas: 



AB 



v 

fc=i 



A.kBk. 



donde p es el numero de columnas de A y el numero de filas de B. 

2.4. Notacion matricial de sistemas de ecuaciones lineales 

Considere el siguiente sistema de ecuaciones: 



2xi + X2+X3 = 4 
4xi — 6x2 + X3 = 15 
3x\ — X2 — X3 = 6 

Este sistema de ecuaciones se puede representar como Ax = b, siendo A = 



x 



Xl 

x 2 

X3 

interpretar 



yb 



4 
15 
6 



2 1 1 
4 -6 1 

3 -1 -1 



. Notese que xyb son vectores columnas, pero al mismo tiempo podemos 



os como matrices de una sola columna. 

2 

La solucion de este sistema es el vector x = —1 

1 



2.6. INVERSA 
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Esta notacion nos permite interpretar el sistema de ecuaciones de dos maneras: 

1. Por filas: cada fila de Ax es combinacion lineal de las variables. 

2. Por columnas: El producto Ax es una combinacion lineal de las columnas de A. 

Al aplicar eliminacion gaussiana, el sistema Ax = b se transforma en uno equivalente de la forma 
Ux = c donde U es una matriz triangular superior. El numero de pivotes en U se conoce como el 
rango de la matriz A. 



2.5. Matriz Identidad 



DEFINICION. La matriz cuadrada /„ = 



1 0 
0 1 



0 0 ••• 1 

otras posiciones se conoce como matriz identidad y tiene la caracteristica de que A mxn I n = A. 



con unos en la diagonal y ceros en las 



2.6. Inversa 



DEFINICION. La inversa de una matriz cuadrada A es una matriz A 1 , tal que A 1 A = I y AA 1 = 
I. 



Si se conoce la inversa de una matriz A entonces para resolver el sistema Ax = b basta multiplicar 
por A -1 y nos queda A" 1 Ax = x = A _1 b. 

Algunas Propiedades: 

Cuando una matriz es invertible la inversa debe ser unica. Si existieran dos matrices diferentes 
B y C tales que BA = I y AC = I entonces nos quedaria que B{AC) = BI = B, pero tambien 
B(AC) = (BA)C = C, es decir B = B{AC) = C. Por lo tanto ByCno pueden ser diferentes. 

(A -1 ) 1 = A, cumple con la definicion. 

(AB)^ 1 = B~ X A~ X , se verifica multiplicando ambos lados por AB. 

{B- l A~ l ){AB) = B~ X A~ X AB = B~ l IB = B~ l B = I 
(AB)(B- 1 A- 1 ) = ABB' 1 A' 1 = AIA' 1 = AA' 1 = I 

Similarmente, {ABC)- 1 = C^B^A' 1 . 

Una matriz cuadrada A de n x n es invertible si y solo si su forma escalerizada tiene n pivotes. 
Si la forma escalerizada tiene algun cero en la diagonal entonces no es invertible y se dice que la 
matriz A es singular. 

Para calcular la inversa, se procede de manera similar a la utilizada para resolver un sistema Ax = 
b, pero en lugar de utilizar un unico b, se utilizan los vectores columnas de la matriz identidad. 
La eliminacion se debe extender hasta que la matriz a la izquierda quede igual a la identidad 
(eliminacion Gauss-Jordan), entonces la matriz a la derecha sera la inversa A^ 1 . 



2.8. MATRICES ELEMENTALES 
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2.7. Traspuesta 

Definicion. La traspuesta de una matriz A se denota A T y sus filas corresponden a las columnas 
de A y sus columnas a las filas de A. 



(A T )ij — Aji 

Propiedades: 

{AB) T = B T A T , se verifica al observar que (^(AB)^ es (AB)^ el cual es el producto de la fila 

j de Ay la columna i de B, mientras que (B T A T ^. . es el producto de la fila i de B (la cual es la 
columna i de B) y la columna j de A T (que es la fila j de ^4). 
(A + B) T = A T + £? T , trivial. 

(^4 _1 ) T = (A T ) _1 , se verifica al hacer AA^ 1 = I y A~ L A = I, trasponiendo, por un lado I r = i, 
(AA^ f = {A~ 1 ) T A T = I y{A- l A) T = A T (A~ 1 ) T = I, lo que hace que {A~ l ) T sea la inversa de 
A T . 

Geometricamente, si A representa una transformacion de un espacio E n a uno E m , la traspuesta 
representa una transformacion del espacio E m al E n (aunque no necesariamente una transforma- 
cion inversa). 

Una matriz en la que se cumple A T = A se denomina matriz simetrica. Estas matrices necesaria- 
mente son cuadradas y la simetria ocurre con respecto a la diagonal. En una matriz simetrica cada 
elemento a-ij = a^. 

2.8. Matrices Elementales 

DEFINICION. Una matriz subdiagonal tiene unos en la diagonal principal, un valor distinto de 
cero en una posicion con i > j y ceros en las demas posiciones. Multiplicar una matriz 
elemental E con el valor I en la posicion por una matriz A produce una matriz que resulta de 
sumar un multiplo / de la ecuacion (fila) j a la ecuacion i. 



Ejemplo. Sea A 



2 1 1 

4-6 0 
-2 7 2 



, para poner un cero en la posicion (2, 1) podemos restar dos 
veces la fila 1 de la fila 2. Esto es equivalente a multiplicar la matriz elemental E = 



1 0 0 
-2 1 0 
0 0 1 



1 


0 


0 " 




-2 


1 


0 




0 


0 


h- 1 





2 1 1 

4-6 0 
-2 7 2 



2 
0 

-2 



Para poner cero en la posicion (3, 1) sumamos la fila 1 a la 3, lo cual equivale a multiplicar la matriz 
10 0 



elemental F = 



0 1 0 

1 0 1 



" 1 


0 


0 " 




2 


1 


1 " 




" 2 1 


1 


0 


1 


0 




0 


-8 


-2 




0 -8 


-2 


1 


0 


1 




-2 


7 


2 




0 8 


3 



2.8. MATRICES ELEMENTALES 
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Finalmente, para tener la forma escalerizada se debe poner un cero en la posicion (3, 2). Para esto 
sumamos la ecuacion 2 a la ecuacion 3, lo cual equivale a multiplicar por la matriz elemental 
10 0 



G = 



0 
0 



0 

1 



" 1 


0 


0 " 




" 2 1 


1 " 




" 2 1 




0 


1 


0 




0 -8 


-2 




0 -8 


-2 


0 


1 


1 




0 8 


3 




0 0 


1 



Notese que todo el procedimiento de escalerizacion es la multiplicacion sucesiva de matrices ele- 
mentales: 



" 1 


0 


0 " 




" 1 


0 


0 " 




0 


1 


0 




0 


1 


0 




0 


1 


1 




1 


0 


1 





1 0 0 
-2 1 0 
0 0 1 



2 1 1 

4-6 0 
-2 7 2 



2 1 1 
0 -8 -2 
0 0 1 



La multiplicacion de matrices elementales produce siempre una matriz triangular inferior. En este 
caso: 



" 1 


0 


0 " 




" 1 


0 


0 " 




1 


0 


0 " 




1 


0 


0 


0 


1 


0 




0 


1 


0 




-2 


1 


0 




-2 


1 


0 


0 


1 


1 




1 


0 


1 




0 


0 


1 




1 


1 


1 



La inversa de una matriz elemental es muy facil de calcular. Basicamente consiste en multiplicar 
por —1 el elemento no cero de la posicion (i, j) (i > j). Es facil verificar que 



" 1 


0 


0 " 




1 


0 


0 " 




" 1 


0 


0 " 


2 


1 


0 




-2 


1 


0 




0 


1 


0 


0 


0 


1 




0 


0 


1 




0 


0 


1 



El proceso inverso a la escalerizacion seria multiplicar la matriz escalerizada sucesivamente por 
las inversas de las matrices elementales usadas para escalerizar. 

Por ejemplo, si GFEA = U (U triangular superior, G, F, E elementales), entonces A = E _1 F _1 G _1 C/ = 
LU, siendo L una matriz triangular inferior. En el ejemplo, 





1 


0 


0 




1 


0 


0 




1 


0 


0 




2 


1 


1 




1 


0 


0 




2 


1 


1 


A = 


2 


1 


0 




0 


1 


0 




0 


1 


0 




0 


-8 


-2 




2 


1 


0 




0 


-8 


-2 




0 


0 


1 




-1 


0 


1 




0 


-1 


1 




0 


0 


1 




-1 


-1 


1 




0 


0 


1 



La ecuacion A = LU proporciona una manera conveniente de resolver un sistema. 

Si Ax = b, entonces LUx = b. Si se hace Ux = y , entonces se puede resolver facilmente Ly = by 
luego Ux = y. Ambos sistemas son faciles de resolver porque L y U son triangulares. 



En ocasiones, la factorizacion LU se escribe como LDU donde Ly U tienen unos en la diagonal y 
D es una matriz diagonal con los pivotes. 



2.9. MATRICES DE PERMUTACION 
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2.9. Matrices de Permutacion 



DEFINICION. Una matriz de permutacion P es una matriz que tiene las mismas filas de la matriz 
identidad, pero no necesariamente en el mismo orden. 

Una matriz de permutacion resulta del intercambio de filas de una matriz identidad. El efecto de 
premultiplicar una matriz A por esta matriz es intercambiar las filas en A. 



Ejemplo: P23 



1 0 0 
0 0 1 
0 1 0 



multiplicada por A 



1 1 1 

0 0 6 
0 3 2 



produce PA 



1 1 1 

0 3 2 
0 0 6 



La realizacion de varios intercambios de filas puede efectuarse mediante la multiplicacion sucesiva 
de matrices de permutacion. Por ejemplo, para intercambiar la fila 1 con la fila 3 y luego la fila 2 
con la fila 3 basta con multiplicar el resultado de las matrices de permutacion correspondientes: 





" 1 


0 


0 " 




" 0 


0 


1 " 




" 0 


0 


1 " 


-P23-P13 — 


0 


0 


1 




0 


1 


0 




1 


0 


0 




0 


1 


0 




1 


0 


0 




0 


1 


0 



Notese que una matriz de permutacion P tiene las mismas filas que la identidad, en algun orden. 
De hecho, P = I es la matriz de permutacion mas simple y comun (no intercambia nada). El 
producto de dos matrices de permutacion es otra matriz de permutacion. El producto de matrices 
de permutacion no conmuta. En el ejemplo anterior, F13P23 daria una matriz P diferente. 

Siempre pueden hacerse los intercambios de filas antes de proceder a la eliminacion, aunque nor- 
malmente no se sabe de antemano cuales filas hay que intercambiar. El hecho de que al aplicar el 
procedimiento de escalerizacion, normalmente los intercambios de filas se realizan en pasos in- 
termedios, realmente no importa cuando estos se realicen. Podemos asumir que se realizan desde 
un principio y trabajar con la matriz PA, que puede ser escalerizada mediante la multiplicacion 
sucesiva de matrices elementales y por lo tanto puede ser factorizada como LU. 

En resumen, en el caso no singular existe una matriz P que reordena las filas de A para evitar 
ceros en las posiciones de los pivotes. En este caso: 

■ Ax = b tiene una solucion unica 

■ La solucion se consigue mediante eliminacion con intercambios de filas 

■ Con las filas reordenadas de antemano, PA puede ser factorizada como LU 

En el caso singular (^4 no invertible) no hay manera de poner numeros distintos de cero en todas 
las posiciones de los pivotes. 



CAPiTULO 3 



ESPACIOS VECTORIALES 



DEFINICION. Un espacio vectorial es un triplete (V, +, •). Los elementos del conjunto V se llaman 
vectores, + es una operacion de suma entre vectores (+ : V x V — ► V) y • es una operacion de 
multiplicacion de un escalar por un vector que produce como resultado un vector; en nuestro caso, 
a menos que explicitamente se indique lo contrario, los escalares perteneceran al conjunto de los 
numeros reales, entonces • : R x V — > V . 

Un espacio vectorial debe cumplir con las siguientes propiedades: 

1. (u + v) + w = u + {v + w) 

2. uv = vu 

3. Existe un unico "vector cero" tal que ^ + 0 = ^,^-0 = 0 para todo v. 

4. Para todo vector v existe un unico vector — v tal que v + (— v) = 0 

5. 1 • v = v 

6. (cic 2 )v = ci(c 2 v) 

7. c(x + y) = cx + cy 

8. (ci + c 2 )x = c\x + c 2 x 

Ejemplos de espacios vectoriales: 

1. Vectores columna en W 1 . 

2. Espacio de dimension infinita 

3. Espacio de matrices de 3 x 2, o de m x n. 

4. Espacio de polinomios de grado n. 

5. Espacio de funciones continuas en el intervalo [0, 1] 

Los espacios vectoriales siempre son infinitos (excepto el caso especial de los espacios vectoriales 
que solo contienen un vector nulo). 

3.1. Independencia y dependencia lineal 

Una expresion de la forma X^=i c * u * donde los Cj son escalares y los Vi son vectores se denomina 
combination lineal. 

Un conjunto de vectores {v i, v 2, • • • , v n } es linealmente independiente (LI) si se cumple que 

n 

^ cm = 0 — >■ Vi(cj = 0) 
1=1 

En un sistema cuadrado homogeneo la solucion es cero y por lo tanto los vectores son linealmente 
independientes. 

Un conjunto de vectores es linealmente dependiente (LD) cuando al menos uno de los vectores es 
funcion del resto. 
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3.3. SUBESPACIOS VECTORIALES 14 

Por ejemplo: {1, x, x 2 ,3x- 2x 2 } es LD, ya que un vector se puede escribir como combination lineal 
de los otros. 

Notese que la independencia lineal es una propiedad del conjunto de vectores y no de los vectores 
individualmente . 



3.2. Generadores, Bases y Dimension 

Un conjunto de vectores {w\,w 2 , ■ ■ ■ , w n } es un generador de un espacio vectorial si cualquier vec- 
tor del espacio se puede expresar como una combination lineal de ellos. 



Vu(3ci, C 2 , • • ■ , Cn{v = ^2 CiWi)) 



1=1 

Lo mas deseable de un conjunto generador es que sea LI. En este caso el generador recibe el 
nombre de base. 

Cuando se trata de una base, para cualquier vector v, la combination lineal de vectores que pro- 
duce v es unica. Suponga que {vi,v 2 , - ■ ■ > v n} es una base y que el vector v se puede representar 
de dos maneras: 

v = a\V\ + a 2 v 2 H h a n v n 

v = bivi + b 2 v 2 H h b n v n 

si restamos ambas ecuaciones nos queda 

0 = v\(ai — b\) + v 2 (a 2 — b 2 ) H \- v n (a n - b n ) 

como la base siempre es LI entonces cjj — b{ = 0 y a« = para todo i. Por lo tanto, solo existe una 

manera de escribir v como combination lineal de los vectores de la base. Si v = a\v\ + 02^2 H h 

a n v n entonces los escalares a« son las coordenadas de v con respecto a la base {v±, v 2 , ■ ■ ■ ,v n }. 

El numero de elementos de la base recibe el nombre de dimension del espacio vectorial. Un espacio 
vectorial tiene infinitas bases, pero la dimension siempre es la misma. La dimension es una pro- 
piedad del espacio vectorial. Siempre que una matriz cuadrada sea invertible, sus columnas son 
linealmente independientes y constituyen una base para R n . 



Por ejemplo, como la matriz 



1 2 
3 4 



es invertible, entonces todo vector en M 2 se puede represen- 



" 1 " 




" 2 " 


3 


y 


4 



tar como una combination lineal de los vectores 



3.3. Subespacios vectoriales 

Definicion. Un subespacio de un espacio vectorial es un subconjunto no vatio que satisface dos 
requerimientos: 

1. Si se tienen dos vectores u y v en el subespacio, su suma u + v tambien esta en el subes- 
pacio. 

2. Si se multiplica un vector v en el subespacio por un escalar c, el producto cv esta en el 
subespacio. 



3.3. SUBESPACIOS VECTORIALES 
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Notese que el vector cero debe pertenecer a todo subespacio ya que se puede dar el caso de c = 0 
y entonces por la regla 2, Ov = 0 debe estar en el subespacio 1 . 

Notese tambien que no todo subconjunto de un espacio vectorial es un subespacio. 

El caso mas extremo para un espacio o subespacio es cuando solo contiene un vector, el vector 
cero. Es un espacio de "dimension cero" y geometricamente puede interpretarse como un unico 
punto en el origen. 

Ejemplo: matrices de 2x2 en las que las sumas de filas y de columnas son todas iguales. Base: 



Recuerde no confundir el escalar 0 con el vector 0 



CAPiTULO 4 



TRANSFORMACIONES LINEALES 



Sean V y W dos espacios vectoriales (posiblemente iguales). Una transformation lineal T es una 
funcion T : V — > W que cumple con las siguientes propiedades: 

1. T{ax) = aT(x) 

2. T(x + y) = T(x) + T(y) 

Siendo x y y vectores del espacio V y am\ escalar. 
Ejemplos de transformacion lineal: 

1. Derivation de funciones reales continuas en un intervalo. 

2. Integration de funciones reales continuas en un intervalo. 

3. Derivacion de polinomios de grado n (pasa vectores en el espacio P n de los polinomios 
de grado n al espacio P n -i). 

4. La multiplicacion de un polinomio por otro polinomio fijo. Por ejemplo, multiplicar poli- 
nomios de grado n por el polinomio 3 + Ax es una transformacion lineal que pasa vectores 
de P n a P n+1 . 

5. Rotacion de vectores en W 1 . 

6. Reflexion de vectores en R n . 

7. Proyeccion de vectores en 1". 

La multiplicacion de una matriz por un vector es una transformacion lineal, ya que se verifican 
las propiedades requeridas: A(ax) = aAx y A(x + y) = Ax + Ay. 

Si se conoce una base {v±, V2, • • • , v n } del espacio V y una base{wi,W2, • • • , w m } del espacio W, 
entonces toda transformacion lineal de V en W se puede representar como una multiplicacion de 
una matriz por un vector. 

Suponga que la transformacion lineal T transforma el vector x del espacio V en el vector T{x) 
del espacio W. Entonces, cada vector Vj de la base de V tiene un transformado Zj en W y por 
definicion, cada uno de estos zj puede ser expresado como combinacion lineal de la base de W. 
Tenemos entonces 

m 

(4.0.1) T(vj) = Zj =^\jWi 

i=l 

Suponga que se tiene un vector x del espacio V cuyas coordenadas con respecto a la base conocida 
son {«i, a-!, ■ ■ ■ ,a n }, entonces tenemos que 

n 

X = Y1 a i v i 

3=1 
16 
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y al aplicar la transformacion lineal T sobre x nos queda 

/ n 

T(x) = T \J2 



a-jV 



n 

3=1 
n m 

E a iE A ^ 

j=i i=i 



m I n 



E E A; j" i 
i=i \j=i 



i=i 



Notese que (/?, /?2, • • ■ , /3 m ) son las coordenadas de T(x) con respecto a la base de W, las cuales 
resultan de fa = Y%=i ^ij a j> e ^ cua l se puede representar matricialmente de la siguiente manera: 

An A12 • • • Ai„ 

A21 A22 • • • A2n 



T{x) 



Ami A m 2 



A,. 









' Pi ' 








ft 











Toda transformacion lineal de W 1 a M m puede ser representada como una matriz de m x n y 
toda matriz de m x n es una transformacion lineal del espacio W 1 a M m . Es decir, el concepto de 
transformacion lineal y matriz es uno y el mismo. 



CAPiTULO 5 



ESPACIOS FUNDAMENTALES 



Sea una Matriz 



A = 



y su matriz escalonada asociada 



y la matriz L subdiagonal tal que 



U 



3 3 2 
6 9 5 
-3 3 0 



13 3 2 
0 0 3 1 
0 0 0 0 



A = LU 



L 



1 

2 1 
-1 2 



0 0 
0 



Los cuatro espacios fundamentales estan asociados a las transformaciones Ax y (A T )y, donde 
Aesmxn. 

■ Espacio de columnas de A, R(A) 
m Espacio de lasfilas de A, R(A T ) 

■ Espacio Nulo de A , N(A) 

■ Espacio Nulo a la izquierda de A, N(A T ) 

N(A)y R{A T ) son subespacios de R n ; R(A) y N(A T ) son subespacios de R m . 

En las explicaciones sucesivas se asumira que A es una matriz m x n y su matriz escalonada 
asociada U tiene r pivotes. Se asumira tambien que A es una transformacion que pasa del espacio 
R n al espacio R m . 



5.1. Espacio de las filas de A, R{A T ) 



Este es el espacio de todas las combinaciones lineales de los vectores fila de A, o lo que es lo mismo, 
las columnas de A T . Este espacio es el mismo generado por las filas de U y tiene por dimension 
el numero de pivotes r. Las filas con el pivote no nulo son independientes y forman una base del 
espacio. 

El espacio generado por las filas de U es el mismo que el generado por las filas de A debido a que 
las filas de U son combinaciones lineales de las filas de A. 

18 



5.2. ESPACIO NULO DE A , N(A) 
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En el ejemplo, los vectores 



" 1 " 




" o " 


3 




0 


3 


y 


3 


2 




1 



constituyen una base para R(A T ). Cualquier vector b 



' 1 " 




" o " 


3 




0 


3 


y 


3 


2 




1 



que hace que el sistema A T y = b sea compatible es combinacion lineal de 

Este espacio es un subespacio de R n ya que esta conformado por vectores que estan en R n . 

5.2. Espacio Nulo de A , N(A) 

N(A) = {x: Ax = 0} 
Las soluciones de Ax = 0 son las mismas de Ux = 0. 

Se obtienen los vectores de la base hallando la solucion de Ux = 0. Esto se hace facilmente dandole 
a una variable libre el valor 1 y a las restantes libres el valor 0. Como hay n — r variables libres y 
una solucion para cada una, y como estas soluciones son independientes, la dimension del espacio 
es n — r. 

En el caso de la matriz U del ejemplo, las variables asociadas a las columnas 1 y 3 son basicas y las 
correspondientes a las columnas 2 y 4 son libres. De la matriz U se tiene: 



^3 



-X4 



X\ = —2X4 — 3X3 — 3X2 = — X4 — 3X2 

Entonces la solucion general de Ux = 0 es 



X2 



" -3 " 




-1 " 


1 
0 
0 


+ x 4 


0 

l 

3 

L 1 



Los vectores 



y 



-l 

o 
i 

3 
1 



son una base del espacio nulo. Como se ve, cualquier vector x 



combinacion lineal de estos vectores (asignandoles valores cualesquiera a las variables libres) hace 



que Ax produzca el vector 



Otra manera rapida de encontrar estos vectores es asignar a cada variable libre, una a una, el valor 
1 y a las otras el valor 0. 

Este espacio es un subespacio de R n . 



5.4. ESPACIO NULO A LA IZQUIERDA DE A, N(A T ) 
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5.3. Espacio de las columnas de A, R(A) 

Este es el espacio de las combinaciones lineales de las columnas de A. Representa el conjunto de 
vectores b para los cuales el sistema Ax = b es compatible. 

Los r pivotes de U indican las columnas independientes. El espacio de las columnas de A no es 
el mismo que el de U, pero las columnas de A que coinciden con las que tienen pivotes en U son 
independientes y forman una base de R(A). 

La razon de esto es que Ax = 0 tiene exactamente las mismas soluciones que Ux = 0. Ax = 0 
expresa una dependencia lineal entre las columnas de A dada por los coeficientes de x. Esta de- 
pendencia es igual a la que existe entre las columnas de U al resolver Ux = 0. Por lo tanto, si un 
conjunto de columnas de U es independiente, entonces tambien lo son las columnas correspon- 
dientes en A y viceversa. 

En el ejemplo, puede verse que la segunda columna tanto de U como de A equivale a tres veces la 
primera y que la cuarta equivale a la suma de la primera columna mas un tercio de la tercera. Los 

son una base del espacio de las columnas de A y cualquier vector b para 

los cuales el sistema Ax = b es compatible puede ser representado como una combinacion lineal 
de ambos. 

Se obtiene entonces el siguiente resultado fundamental: La dimension del espacio de filas de A y 
del espacio de columnas es la misma, r, y los pivotes de U indican una submatriz cuadrada de r 
filas y columnas que forman una matriz invertible. Esta dimension r es el Rango de A. 





1 " 




" 3 " 


vectores 


2 


y 


9 




-1 




3 



que es invertible, pues 



En el caso del ejemplo, los pivotes determinan la submatriz de A 
al escalerizar quedan dos pivotes. 

Este espacio es un subespacio de M. m y tambien es conocido como recorrido de A ya que incluye a 
todos los vectores en el recorrido de la funcion Ax. 



5.4. Espacio Nulo a la izquierda de A, N(A T ) 

Este es el espacio nulo de A T . Es decir, el espacio de los vectores y tales que A T y = 0, o lo que es lo 
mismo y T A = 0. Si se tiene A = LU o PA = LU y U tiene sus ultimas m — r filas nulas, entonces 
U = L" 1 A y las ultimas m — r filas de L^ 1 o L~ 1 P constituyen una base del espacio nulo a la 
izquierda, ya que estas filas multiplicadas por la matriz A producen las filas de ceros en la matriz 
U. 



En el ejemplo, 

L- 1 = 



1 0 0 
-2 1 0 
5 -2 1 



Entonces el vector 



5 
-2 
1 



13 3 2 
0 0 3 1 
0 0 0 0 



es una base del espacio nulo de A T , ya que cualquier vector y multiplo 



de 



hace que A T y = 0 <^ y T A = 0. 
Este espacio es un subespacio de M m . 
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5.5. Bases complementarias 

R(A) y N(A T ) son subespacios de W 11 de dimension rym-r, ambas bases conforman una base 
del espacio total. Idem para el espacio de filas y espacio nulo de A. 

Mas adelante se probara que son ortogonales. 



5.6. Solucion de sistemas 



Dado el sistema Ax = b, que tenga solucion es equivalente a que b sea combinacion lineal de las 
columnas de A. Luego, b G R(A). 

Si se define matriz ampliada del sistema, A + b, a la matriz que se obtiene de agregar la columna b a 
A, decir que el sistema Ax = b tiene solucion es equivalente a decir que: rango{A + b) = rango(A). 

El proceso de eliminacion gaussiana se realiza simultaneamente sobre A + b por lo tanto: 

Ax = b o Ux = L~ l b 



Rango(A) = r. El vector L 1 b debe tener sus ultimos m — r valores nulos para que el sistema sea 
compatible. 

Suponga que queremos resolver el sistema Ax = b, con la matriz A del ejemplo anterior y el vector 



El vector L 1 6 es entonces 



2 
-3 
0 



. La matriz ampliada A+b es 



3 3 2 
6 9 5 
-3 3 0 



la cual al aplicar el proceso de eliminacion queda 



Puede observarse que el 



1 3 3 2 2 
0 0 3 1-3 
0 0 0 0 0 

rango de la matriz ampliada es 2, al igual que la matriz A, por lo tanto Ax = b tiene solucion para 
2 ~ 
1 

-8 

Si pasamos de la notacion matricial a la notacion de ecuaciones, nos quedan las ecuaciones 

Xi + 3X2 + 3x3 + 2x4 = 2 

3X3 + X4 = —3 



Esta claro que las variables x\ y X3, que estan en las posiciones de pivote son basicas y x 2 y X4 son 
libres. Al resolver hacia atras nos queda: 

1 

x 3 = -1 - -x 4 
xi = 5 — 3x2 — X4 



El vector solucion x puede ser reescrito como: 



5 — 3x2 — X4 




5 " 




" -3 " 




-1 " 


X2 




0 




1 




0 


— 1 — |x4 




-1 


+ x 2 


0 


+ X4 


1 

3 


X4 




0 




0 




1 
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22 



Observese que la solucion de este sistema se parece bastante a la solucion del sistema homogeneo 

5 



Ax = 0 (espacio nulo de A). La unica diferencia es que se anade el vector 



0 
-1 
0 



. Este vector es 



lo que se conoce como una solucion particular de Ax = 6. La solucion particular proporciona una 
solucion del sistema y los dos terminos adicionales agregan aun mas soluciones, ya que satisfacen 
Ax = 0. 

La solucion general xdeun sistema Ax = b siempre es la suma de una solucion particular x p mas 
la solucion del sistema homogeneo ya que si Ax = by Ax p = b entonces Ax — Ax p = 6 — 6 = 0, 



luego x — x p € N(A). Entonces x 



Xh, siendo Xh la solucion general del sistema homogeneo, 



es decir el conjunto de todas las combinaciones lineales de los vectores de la base de N(A) y por 
lo tanto x = x p + Xh- 

Una manera rapida de encontrar la solucion particular es asignar 0 a todas las variables libres y 

L _1 6, siendo U p la submatriz de U que incluye unicamente las colum- 



resolver el sistema U p x p 



nas con las variables basicas. En el ejemplo U p 
unicamente las ecuaciones 

X\ + 3^3 

3x 3 



De donde x3 = — 1 y x\ = 5. De ahf que la solucion particular sea 



" 1 


CO 




2 " 


0 


3 


, L~ x b = 


-3 


0 


0 




0 



y nos quedarian 



5 
0 
-1 
0 



5.6.1. Matrices de rango completo. Una matriz idem filas y n columnas es de rango com- 
pleto si Rango(A) = min(m, n). En el caso de matrices de rango completo se presentan dos casos 
con respecto a las soluciones del sistema Ax = 6: 

EXISTENCIA: Ax = 6 es soluble y tiene al menos una solucion x para todo 6 si y solo si las 
columnas generan R m , es decir rango(A) = m. En este caso existe una matriz inversa a la 
derecha C tal que AC = I m . Esto es posible solo si m < n (mas columnas que filas o igual 
numero). 

UNICIDAD: Ax = b tiene a lo sumo una solucion x para todo 6 si y solo si las columnas 
son linealmente independientes, es decir Rango(A) = n. En este caso existe una matriz 
inversa a la izquierda B tal que BA = I n . Esto es posible solo si m > n (mas filas que 
columnas o igual numero). 

En el primer caso, una posible solucion es x = Cb, puesto que Ax = ACb = b. Pero habra mas 
soluciones si existen otras inversas a la derecha. 

En el segundo caso, si hay una solucion a Ax = 6, entonces esta tiene que ser x = BAx = Bb, pero 
podria no haber solucion. 

Si n > m entonces una inversa a la derecha de A es A T (AA T )~ 1 . 

Si m > n entonces una inversa a la izquierda de A es (A T A)' 1 A T . 

Si m = n la inversa a la izquierda es la misma que la de la derecha y es A -1 . 
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En general, si las columnas de A son linealmente independientes (Rango =n) A T A es cuadrada, 
simetrica e invertible. 

A T A obviamente es una matriz cuadrada denxn. Es simetrica porque (A T A) T = A T A TT = A T A. 

Para que A T A sea invertible es necesario que sus columnas (y por ende sus filas) sean linealmente 
independientes. Es decir, debe ser de rango n. Esto equivale a decir que su espacio nulo tenga 
dimension cero. 

El espacio nulo de A T A siempre es igual al espacio nulo de A. Para demostrar esto hay que de- 
mostrar que los vectores del espacio nulo de A estan en el espacio nulo de A T A y viceversa. 

Lo primero se verifica al ver que si un vector x esta en N(A), entonces Ax = 0, y A T Ax = 0; por 
lo tanto x esta en N{A T A). 

Para demostrar lo segundo, supongamos que x <G N(A T A), entonces (A T A)x = 0, entonces 
x T A T A = 0 y (Ax) T A = 0. Para demostrar que (Ax) T A es cero, multipliquemos a la derecha en 
ambos lados de la ecuacion por x y nos queda (Ax) T (Ax) = 0. Esto es el producto de un vector fila 

OL\ 
«2 



por el equivalente vector columna. Si Ax 



, entonces (Ax) (Ax) sera af + a^-l ha 



2 

m' 



lo cual es una suma de numeros no negativos (ver Seccion 6.1). La unica manera de que esta suma 
sea cero es que todos los «j sean cero y por lo tanto tanto Ax = 0; entonces x € N(A). 

Si las columnas de A son linealmente independientes, entonces el espacio nulo de A tiene di- 
mension cero y por consiguiente el espacio nulo de A T A tiene tambien dimension cero y por lo 
tanto A T A es invertible. Por esta razon (A T A)~ l A T es una inversa a la izquierda de A cuando 

Rango(A) = n y la solucion de Ax = b es x = (A T A)^ 1 A T b. 

Si las filas de A son linealmente independientes, el mismo analisis aplica para determinar que el 
espacio nulo de ^tiene dimension cero y por lo tanto ^^es invertible. Entonces A T (AA T )~ 1 
es una inversa a la derecha cuando Rango(A) = m. En este caso la solucion de Ax = b es x = 

A T (A T A)- 1 b. 



CAPiTULO 6 



ORTOGONALIDAD 

6.1. Producto escalar 

DEFINICION. El producto escalar de dos vectores x y y (x, y £ R n ) esta definido como 

n 

(6.1.1) (x, y) =x T y = Y^ %jVj 

j'=i 

El producto escalar permite introducir los conceptos de longitud de un vector y distancia entre 
dos vectores. 

DEFINICION. La longitud o norma ||x||de un vector x en R n es la raiz cuadrada positiva de 

(6.1.2) ||x|| 2 = x\ + x\ + • • • + x 2 = x T x 

Esto equivale a aplicar la formula del teorema de Pitagoras n — 1 veces, anadiendo una dimension 
en cada paso. 

DEFINICION. La distancia entre dos vectores x y y es d(x, y) = \\x — y\\. Esta distancia es conocida 
como distancia euclidea. 

6.2. Algunas Propiedades 

(x + y) T (u + v ) = x T u + x T v + y T u + y T v 
x T x > 0, x T x solo es cero cuando x es cero. 

T T 

x y = y x 

z T (ax + (3y) = az T x + (3z T y, ay [3 son escalares. 

6.3. Vectores ortogonales 

DEFINICION. Dos vectores xy y son ortogonales si x T y = 0. 

Si x y y en M™ son ortogonales, entonces forman un triangulo rectangulo donde las longitudes de 
los catetos son ||x||, ||y|| y la de la hipotenusa es \\x — y\\. Entonces ||x|| 2 + ||y|| 2 = \\x — y\\ 2 . 

Aplicando la formula 6.1.2, nos queda 

(xj + x\ H v x 2 n ) + (yf + y\ H V yl) = (xi - yi) 2 + {x 2 - yif H h (in - J/n) 2 

El lado derecho queda 

{x\ + x\ H h x 2 ) - 2 (xiyi + x 2 y2 H h x n y n ) + (yf + y| H h y 2 ) 
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El lado izquierdo se cancela con parte del derecho y queda 

0 = -2 (xiyi + x 2 y 2 H h a^S/n) 

Lo que equivale a 

xiyi + X2V2 H h a^nl/n = x T y = 0 

COROLARIO. El vector cero es ortogonal a todos ya que x T 0 = 0 T x = 0. 

COROLARIO. Si {x\ Xpjson ortogonales y distintos de cero entonces son linealmente independientes. 

DEFINICION. UyW subespacios ortogonales si Vx <G U, y <G W(x T y = 0). 

6.4. Espacios fundamentales 

Teorema. R(A) y N(A T ) son subespacios ortogonales de R m de dimension rym-r. 

DEMOSTRACION. b e R(A),c e N(A T )=> b = Ax, c T A = 0;=> c T b = c T Ax = Ox = 0 □ 
es decir c y b son ortogonales. 

De igual manera se prueba que el espacio nulo de A es ortogonal al espacio de las filas de A. 

Otra manera de realizar la demostracion es observar que si x pertenece al espacio nulo, entonces 
Ax = 0 y por lo tanto 



Ax = 



La fila 1 es ortogonal a x ya que su producto escalar es cero. Lo mismo aplica para todas las filas. 
Como el vector x es ortogonal a cualquier fila, entonces es ortogonal a cualquier combinacion de 
ellas. 



fila 1 




Xl 




' 0 " 


fila 2 




X2 




0 


fila m 




Xn 




0 



6.5. Angulos entre vectores 

Sean a y b dos vectores en R 2 tales que sus valores son (a±, 02) y {b\ , b 2 ) y forman angulos ay (3 con 
respecto al eje x. Estos vectores forman un triangulo donde la longitud del tercer lado es ||6 — a\\. 
El angulo 6 opuesto al lado ||6 — a\\ es (3 — a. 

Recordando que el vector a forma un triangulo rectangulo de hipotenusa ||a|| y catetos a\ y 02 con 
respecto al eje x, se sabe que 



sen a 



0.2 



y cos a 



Hall 



Lo mismo aplica para b y su angulo correspondiente (3: el seno es 62/ ||6|| y el coseno b\j ||6||. Puesto 
que 6 = (3 — a, su coseno se puede calcular con la identidad: 

a\b\ + a 2 6 2 



(6.5.1) 



cos 6 = cos [3 cos a + sen (3 sen a 



El numerador en 6.5.1 es a T b y llegamos a la conclusion de que el coseno del angulo entre dos 
vectores a y b es 

(6.5.2) cos 6 = „ 



6.7. PROYECCIONES SOBRE ESPACIOS Y APROXIMACIONES CON MINIMOS CUADRADOS 
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6.6. Proyecciones sobre lmeas 

La proyeccion del vector b sobre el vector a es el punto p sobre a que esta mas cercano a b. p esta 
en la misma direccion de a y por lo tanto p = Xa. La linea de b a p equivale al vector b — p = b — Xa. 
Para determinar p basta saber que la lmea de b a p debe ser perpendicular a a: 

T a T b 
alb — Xa) = 0, A = -~— 
a 1 a 

Entonces la proyeccion p del vector b sobre el vector a esta dada por 

a T b a T b aa T 
p = Xa = —^a = a^r- = -r^b = Pb 



T 

a 1 a 



T T 

a 1 a a 1 a 



P es una matriz cuadrada que resulta de multiplicar una columna por una fila {aa T ), dividida por 
el escalar a T a. 

La matriz tiene dos propiedades de todas las matrices de proyeccion: 



1. P es simetrica, P T 

2 p2 _ p p2 aa T > 



(aa T y 



T 

aa 
a T a 



= P 

a(a T a)a T 



a 1 a a 1 a a 1 aa 1 a 



La matriz P tiene rango I, ya que todas las filas son multiplos de a, al igual que las columnas. 
Ejercicio: ^Es P invertible? 

Ejemplo: La matriz que permite proyectar sobre la linea del vector a = (1, 1, 1) es 

ill 

? ! I 
! ! I 

3 3 3 



P = 



aa T 1 
a T a 3 



[1 1 1 



El rango P es uno. El espacio de las columnas es la linea que pasa por a = (1, 1, 1) y el espacio 
nulo es el piano perpendicular a a. 

En general, como todas las columnas de P son multiplos de a, Pb esta en la linea que pasa sobre 
a. 

Los vectores que satisfacen a T b = 0 son perpendiculares a a y su componente sobre la linea de a 
es cero. Estos vectores estan en el piano perpendicular a a, que es el espacio nulo. 



6.7. Proyecciones sobre espacios y aproximaciones con mlnimos cuadrados 

Cuando se presenta un problema con varias ecuaciones y una sola incognita el sistema tiene no 
mas de una solucion. 



a\x = b± 
a 2 x = b 2 

O-rnX = b m 

Si las ecuaciones no son todas equivalentes el sistema no tiene solucion. Es decir, solo hay solucion 
si b = (&i, &2j ■ ■ ■ ) b m ) es multiplo de a = (a±, a 2 , ■ ■ ■ , a m ) . 

Es frecuente que se presenten sistemas incompatibles, y aun asi, estos deben ser resueltos. En estos 
casos, la opcion apropiada es escoger un x tal que minimice el error promedio de las m ecuaciones. 
La manera mas conveniente de definir ese promedio es la suma de cuadrados: 
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E 2 = (aix - h) 2 + (a 2 x - b 2 ) 2 H h (a m x - b m ) 2 



Si existe una solucion exacta a ax = b, el error mmimo es E = 0. En el caso en que b no es 
proporcional a a, E 2 sera una parabola con el mmimo en el punto donde la derivada del cuadrado 
del error sea cero: 

dE 2 

—j— = 2[(aix - bi)ai + (a 2 x - b 2 )a 2 H h {a rn x - b m )a m )] = 0 

Despejando x nos queda que el punto donde x = 0 es 

«i&i + 02^2 H h a m b m a T b 



x = 



a 2 + a\ + • • • a T a 



6.7.1. Minimos cuadrados con varias variables. Supongase que tenemos Ax = b, siendo 
A una matriz m x n. Es decir, que ahora hay n variables en lugar de una. Suponemos que hay 
mas observaciones que variables (m > n), asi que puede esperarse que Ax = b sea incompatible. 
Probablemente el vector b no sea una combinacion de las columnas de A, es decir, estara fuera del 
espacio de las columnas. 

El problema es encontrar un x que minimice el error utilizando el criterio de minimos cuadrados. 
Ax siempre sera un vector en el espacio de las columnas, entonces el problema es encontrar el pun- 
to p = Ax que es mas cercano a b entre los vectores del espacio de las columnas. Geometricamente 
se sabe que el vector del error (b — Ax) debe ser perpendicular al espacio de las columnas. 

Los vectores perpendiculares al espacio de las columnas estan en el espacio nulo a la izquierda. 
Asi, el vector de error b — Ax debe estar en el espacio nulo de A T : 

A T (b - Ax) = 0 A T Ax = A T b 
Si las columnas de A son linealmente independientes, entonces A T A es invertible y 

(6.7.1) x = (A T A)~ 1 A T b 

La proyeccion de b en el espacio de las columnas es, por lo tanto, 

(6.7.2) p = Ax = A{A T A)~ 1 A T b 

Propiedades: 

1. Supongase que b esta en el espacio de las columnas de A, es decir b = Ax. Entonces la 
proyeccion de b sigue siendo b: p = A{A T A)~ 1 A T Ax = Ax = b. 

2. Supongase que b es perpendicular al espacio de las columnas de A, es decir A T b = 0. En 
este caso la proyeccion es el vector cero: p = A(A T A)~ 1 A T b = A(A T A)~ 1 0 = 0. 

3. Cuando A es cuadrada e invertible, el espacio de las columnas es todo el espacio. Todo 
vector se proyecta en si mismo: p = A(A T A)~ 1 A T b = AA~ l (A 7 *)' 1 A 1 b = b. 

4. Si A tiene solo una columna con el vector a la matriz A T A es el numero a T a y x = 
a T b/(a T a). 

De la ecuacion 6.7.2 observamos que el punto mas cercano a b es p = A(A T A)~ 1 A T b. La matriz 

P = A(A T A)~ 1 A T 
es una matriz de proyeccion y tiene dos propiedades basicas: 

1. Idempotencia: P 2 = P, P 2 = A{A T A)~ l A T A{A T A)~ l A T = A(A T A)~ 1 A T = P 
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2. Simetrla: P T = P, P T = (A(A T A)' 1 A T ) T = A{{A T A)~ X ) T A T = A((A T ' A) T )~ X A T = 
A{{A T A))~ 1 A T = P 

DEFINICION. Una matriz de proyeccion es aquella que es simetrica e idempotente. 

Si A es una matriz cuadrada invertible, entonces la matriz de proyeccion es la identidad: 

P = A(A T A)~ 1 A T = AA~ 1 (A T )- 1 A T = I 

6.8. Bases ortogonales 

DEFINICION. La matriz Q es ortogonal si es cuadrada y sus columnas son ortonormales. Tiene las 
siguientes propiedades: 

- Q T = Q- 1 

■ \\Qx\\ = \\x\\ preserva longitudes: (Qx) T (Qx) = x T Q T Qx = x T x 

■ (Qx) T (Qy) = x T y preserva angulos (cosenos de angulos) 

■ & = PjQj entonces (3j = b T qj 

■ Q T tambien es ortogonal 

Ejemplos de matrices ortogonales: 



Q 



cos 6 — sen 0 
sen 9 cos 6 



, Q T = Q- 1 



cos 6 sen 0 
- sen 0 cos 9 



Cualquier matriz de permutacion es ortogonal. 

6.8.1. Matrices rectangulares con columnas ortonormales. Para resolver el problema Qx = 
b cuando Q es rectangular (mas filas que columnas, que es el caso mas frecuente). Se tienen n 
vectores ortonormales qi que son las columnas de Q. Cada vector tiene m (m > n) componentes. 
Qx = b se resuelve utilizando mmimos cuadrados. 

La clave aqul es que Q T Q = I n . Q T ya no es la inversa de Q (Q no es cuadrada), pero sigue siendo 
la inversa a la izquierda. Esto es, Q T Q = I n , pero QQ T es una matriz m x m que no es I m . 

La matriz de proyeccion, que normalmente seria Q(Q T Q)~ l Q T , se convierte en P = QQ T . 

6.8.2. Bases ortonormales. 

Teorema. Supongase que qi,q 2 ,...,q n es una base ortonormal de un espacio. Todo vector b en dicho 
espacio es la suma de sus proyecciones unidimensionales sobre las lineas de los q's. 

DEMOSTRACION. Todo b es una combinacion lineal de los vectores de la base: 
b = Ai<?i + A 2 <?2 + ••• + Kq n 

Si se multiplican ambos lados por q\, entonces queda 

qfb = \iq[qi 

A la derecha todos los componentes desaparecen porque qfqj = 0 para j ^ 1. Como q\ q\ = 1, 
queda 

Ai = qjb 

El mismo analisis aplica para los otros qj. Entonces, cualquier vector b se puede expresar como: 

b = (q[b)qi + {qlb)q 2 H h {qlb)q n 

Nota: La expresion Ai = q[b/q[qi es la proyeccion sobre una linea. En el caso ortogonal la expre- 
sion se simplifica a Ai = qjb. □ 
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6.8.3. Gram-Schmidt. Siempre resulta mas conveniente trabajar con una base ortonormal. 
Existe un procedimiento denominado "Gram-Schmidt" que permite transformar un conjunto de 
vectores {0,1,0,2, - ■■ , a n } LI en un conjunto de vectores ortonormales {gi, 02, • • ■ ,q n } que generan 
el mismo espacio. 

Para conseguir qi simplemente se toma el vector unitario en la direccion a 1 . Entonces q± = a± / \\ a± || . 

q2 debe ser un vector ortogonal a q±. Si a 02 se le resta su proyeccion sobre qi el resultado es la 
proyeccion de 02 sobre una direccion ortogonal a q\. La proyeccion de a 2 sobre q± es (gf a2)<7i (ver 
Seccion 6.8.2). Entonces existe un 62 ortogonal a q\ que es 62 = «2 — (qjb)qi. q2 seria entonces el 
vector unitario en la direccion 62, o 2 = ^2/ H^H- 

^3 debe ser ortogonal a giy 52- Si a 03 se le restan sus proyecciones sobre qi y q2 el resultado es la 
proyeccion de 03 sobre una direccion ortogonal a q\ y 92- Entonces existe un 63 ortogonal a gi y (72 
tal que 63 = 03 — (qj a^)qi — (g-fas)^- <73 es e l vector unitario en la direccion 6 3 , (73 = 63/ 1 1 i>3 1 1 . 

En general, para obtener cada q k obtenemos un b k ortogonal a los qi previamente hallados restando 
a a k sus proyecciones sobre los qi y luego dividiendo b k por su norma. 

k-l 

h = a k - ^2(qfa k )qi 
i=l 

h 

qk ~ INI 

6.8.4. Factorizacion QR. Supongase que se tiene una matriz Ademxn cuyas columnas son 
los vectores m-dimensionales LI a±, 02, ■ ■ ■ ,a n . 

Esta claro que se puede aplicar el procedimiento de Gram-Schmidt sobre los vectores a 1 , 02 , • • • ,a n 
para obtener un conjunto de vectores ortonormales q±, q2, ■ ■ ■ ,q n - 

Se sabe que cada vector a k puede ser expresado como una combinacion lineal de los vectores qi ya 
que estos tambien constituyen una base. 

De la Seccion 6.8.2 se sabe que si se usa una base ortonormal, cualquier vector a k es la suma de las 
proyecciones sobre los vectores de la base. Entonces 

afc = (qja k )qi + {qla k )q 2 H h {(&a k )q n 

De la Seccion 6.8.3 se sabe que a\ esta en la direccion de q\, que 02 esta en el piano formado por 
giy q2) y en general a k esta en el espacio generado por los vectores desde q\ a q k . 

Entonces 



01 = (qjai)qi 

a 2 = {qja 2 )qi + (g^)^ 

«3 = {q[ 03)91 + (<?2°3)g2 + (g 3 r a 3 )g 3 



n 

i=i 
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Esto puede escribirse matricialmente como: 



A = [ ai a 2 



[ qi <?2 • • • q n ] 



T T 

qf ai qf a 2 
0 qja 2 



qfa n 
q\a n 



qn a n 



donde Ay Q son rectangulares y Res cuadrada supra triangular e invertible. 
Aplicado al problema de la resolution por mmimos cuadrados (Section 6.7.1) : 

(A T A)x = A T b 

queda 

(R T Q T QR)x = (R T R)x = R T Q T b Rx = Q T b 
que se resuelve muy facilmente ya que R es triangular. 



CAPiTULO 7 



DETERMIN ANTES 



El determinante de una matriz cuadrada es una medida del volumen del paralelepipedo formado 
por sus vectores filas o columnas. 

Definicion. El determinante de A es la suma de los n! productos que se pueden formar eli- 
giendo un elemento por fila y uno por columna de A (dicha eleccion coincide con una matriz de 
permutacion), cada producto esta ademas multiplicado por el signo de la paridad del numero de 
inversiones o intercambios necesarios para convertir la permutacion indicada en la identidad. 

detA = 2>Mi) a na(n) (-ir^ 



En el caso particular de matrices de 2 x 2, det 



a b 




a b 


c d 




c d 



ad — be. 



7.1. Propiedades 

1. Si se multiplica una fila por una constante, det A queda multiplicado por esa constante. 
Cada termino de la sumatoria que se utiliza para calcular det A incluye un unico elemento 
de cada fila, entonces todos los elementos de la sumatoria quedan multiplicados por la 
constante. 

2. Si el vector que compone una fila cualquiera es la suma de dos vectores (fila i = v \ + v 2 ) 
entonces det A = det A\ + det A2 donde A\ tiene todas sus filas iguales a las de A excepto 
que en la fila i tiene el vector vf. A 2 tiene todas sus filas iguales a las de A excepto que en 
la fila i tiene el vector v 2 . Supongase que cada termino de la fila i de A es = v\j + v 2 j , 
entonces 

det ,4 = E CT «ia(i)--K + v 2j )....a na{n) (-\r^) 

detA = E CT «Mi)--K)--«na(n)(-l) si9no(CT) + E ff «m).-(^)....a lw( „)(-l) s,9noW 

det A = det A 1 + det A 2 

3. Si se intercambian dos filas det A cambia de signo. Al intercambiar dos filas es evidente 
que la magnitud no cambia de signo, pero el signo cambia ya que hay un intercambio 
adicional para convertir la permutacion en la identidad. 

4. det I = 1. En este caso el unico producto en la sumatoria que no produce ceros es el de la 
diagonal y es 1. 

5. Si dos filas son iguales, det A = 0. Si se intercambian las filas iguales esta claro que det A 
no varia. Por la propiedad 3, el signo cambia, entonces det A = — det A y por lo tanto 

detA = 0. 

6. La operacion de sumar a una fila un multiplo de otra deja el determinante sin modifica- 
ciones. Supongase que la fila % esta formada por el vector fila fi y la fila k esta formada 
por el vector fila (i 7^ k). Sea B una matriz igual a A excepto que la fila i es sustituida 
por fi + cfk ; por las propiedades 1 y 2, det B = det A + c det C, donde C tiene las filas 
iguales a A excepto que la fila i esta compuesta por el vector fila Por la propiedad 5, 
det C = 0, ya que las filas i y k de C son iguales. 
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32 



Esta propiedad se puede extender sin dificultad a la operacion de sumar a una fila 
una combinacion lineal de las otras filas. 

7. Si A tiene una fila de ceros entonces det A = 0. Todos los elementos de la sumatoria inclu- 
yen un elemento de la fila de ceros y por lo tanto todos los terminos de dicha sumatoria 
valen cero. 

8. Si A es triangular, det A es el producto de los elementos de la diagonal. Los elementos 
de la sumatoria siempre incluyen un elemento de cada fila y cada columna. Salvo por 
la permutacion correspondiente a la diagonal, todas las permutaciones incluyen algun 
elemento debajo de la diagonal y por lo tanto los terminos de la sumatoria asociados a 
dichas permutaciones valen cero. 

9. Si A es singular, det A = 0. En este caso se pueden aplicar pasos de eliminacion hasta que 
quede una fila de ceros sin modificar el determinante (propiedad 6). Por la propiedad 7 el 
determinante es cero. 

10. det A = det A T . Los terminos que resultan al escoger un elemento de cada fila y cada 
columna son los mismos que los que resultan al escoger un elemento de cada columna y 
cada fila. 

11. det AB = (det A) (det B). Si D es una matriz diagonal, det DB = (det D) (det B) ya que 
DB resulta de multiplicar cada fila de B por el elemento de la fila correspondiente en B. 
Por la propiedad 1 det DB es igual a det B multiplicado por todos los elementos de la 
diagonal de D, pero det D es precisamente el producto de los elementos de la diagonal 
(propiedad 8). 

Utilizando eliminacion Gauss-Jordan se puede reducir la matriz A a una diagonal D 
sin modificar el determinante (excepto por los cambios de signo al intercambiar filas). Los 
mismos pasos transforman AB a DB sin modificar el determinante. Entonces 

det AB = det DB = (det L>)(det B) = (det A) (det B) 

si el numero de intercambios es impar, det AB = — det DB = — (det D) (det B) = (det ^4) (det B) 

12. det A- 1 = - S ^- K . Segun las propiedades 4 y 11, det AA~ X = (det ,4) (det A' 1 ) = det I = 1, 
entonces det A" 1 = 

13. Si Q es ortogonal, |det Q| = 1. Como Q es ortogonal, QQ T = I; entonces det(QQ T ) = 
detQdetQ T = (detQ) 2 = 1. 

14. Si A es no singular y admite una descomposicion PA = LDU entonces det P det A = 
Y\ pivotes. Esta claro que det PA = det P det A y det(LDU) = det L det D det U. Como L 
y U son triangulares con unos en sus diagonales, sus determinantes son 1 y como D es 
diagonal, su determinante es el producto de los pivotes. 

7.2. El determinante como medida de volumen 

El determinante de una matriz es una medida del volumen del paralelepipedo formado por sus 
vectores filas o columnas. 

n 

|det A| = \det(QR)\ = \detQ\ |deti?| = deti? = JJaf^ 

i=i 

En el caso de dos dimensiones el valor absoluto del determinante es el area del paralelogramo 
formado por los vectores a±y a<i- Esta area es el producto de la base del paralelogramo por su 
altura. Si tomamos como base el vector a\, cuya longitud es ||ai || = a\q\, entonces la altura viene 
dada por la proyeccion de a,2 sobre la perpendicular a a\ (y qi que es colineal), es decir, (a^q^)^- 
Esta proyeccion tiene longitud a^q2 y por lo tanto el area es (af qi){a^q2)- 

El mismo razonamiento aplica para los casos de mayor dimension. 



7.3. REGLA DE CRAMER 
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Notese que si los vectores son linealmente dependientes el volumen es 0, es decir, si la matriz es 
singular entonces su determinante es nulo. 



7.3. Regla de Cramer 



7.3.1. Cofactores. 

Definicion. 



co f actor Aij = det M i:j 

donde Mj jes la matriz deducida de A al suprimirle la fila i y la columna j. 

TEOREMA. El determinante de A se expresa enfuncion de los cofactores de una fila: 

det A = ^ a ki A k 



Tambien es vdlido el desarrollo por columnas. 
Si se cambia la fila k por la i entonces: 

0 = ^2 a hi A ki h + i 



7.3.2. Aplicaciones. La inversa se deduce del desarrollo A * A T cofactores = (det A) I . En- 
tonces inv(A) = ^gf^ 



A = 



1 

3 
2 



Det(A) = 25 



Co f actor (A T ) 



3 4 
1 7 
3 3 



-18 
5 
7 



3 17 

-5 5 
3 -8 



La matriz del numerador, A T cofactores, se forma con la traspuesta de los cofactores de A. 

Regla de Cramer. Dado el sistema Ax = b con A invertible, cada componente de la solucion Xj se 
determina por el cociente de determinantes: 

det Bi 



X 7 



det A 



donde Bj se obtiene reemplazando la columna j'de A por el vector b. 



CAPiTULO 8 



VALORES Y VECTORES PROPIOS 



Definicion. Xy v son un valor y vector propio de la matriz cuadrada A si se satisface: Av = Xv. 

Si se ve la matriz A como una transformation del espacio M" en si mismo, pueden verse los vecto- 
res propios como aquellas direcciones en las que el vector transformado es colineal con el original. 
El valor propio es la relation entre la longitud del vector transformado y el original. 

Notese que cuando se habla de un vector propio, lo que realmente es propio es la direction del 
vector. Cualquier vector y colineal con un vector propio v es propio tambien. 

Ay = A(cv) = cAv = cXv = Xy 

y su determinante se anula para A = — 1, 2. 



Si^ = 



4 -5 
2 -3 



=> A - XI = 



4 - A -5 
2 -3- A 



La ecuacion Av = Xv es equivalente a (A— XI)v = 0, es decir, v pertenece al espacio nulo de A — XI, 
y A debe ser elegido para que la matriz resultante sea singular, es decir: 

det{A - XI) = 0 

Al determinante det(yl — XI) = 0 se le llama Polinomio caracteristico y su grado es n, luego tiene n 
raices Xj en el campo complejo. 

Para cada Xj se determina una base del espacio nulo de A - Xjl. Esta base genera el espacio de 
vectores propios asociados al valor propio Xj. En general suele haber un solo vector en esa base y 
se dice que forman un par: el valor propio y su vector propio asociado. 



En el ejemplo anterior, para A = — 1 la matriz A — (-1)1 



Notese que los valores propios pueden ser complejos. Por ejemplo considerese la matriz A 



' 5 


-5 " 




' 1 " 


2 


-2 


y v = 


1 



0 1 

-1 0 



. En este caso det(A - XI) = A 2 + 1. Este polinomio tiene como raices X± = i y X2 = —i. 



,sta matriz representa una rotation de 90 grados y por lo tanto no existen valores propios reales. 



8.1. Propiedades 

8.1.1. Traza e Identidad. 

Teorema. Los valores propios satisfacen las siguientes identidades: 



n 



Traza(A) = ^2>^j = Yl a '' d Det ( A ) = Yl A i 
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8.2. FORMA DIAGONAL 
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DEMOSTRACION. En el caso de Det(A — IX) cualquier termino que incluya un fuera de la 
diagonal excluye los terminos an — A y ajj — A. Por lo tanto dichos terminos no incluyen (— A) n_1 . El 

coeficiente de (— A)™ -1 debe provenir de la diagonal principal yes an +ci22~\ Va nn = X\+- • -+A n . 

Recuerdese que en un polinomio de grado n el coeficiente del factor n — 1 es opuesto de la suma 
de las rakes. 

Cuando A = 0, Det(A — IX) = Det(A). Si A = 0 lo que queda del polinomio es el termino in- 
dependiente y este siempre es igual al producto de las raices, que en este caso son los valores 
propios. □ 

Ejercicio: Si A = 0 es valor propio de A ^cual es el subespacio de vectores propios asociado? 

8.1.2. Matriz Identidad. 

Teorema. Si A = I todo vector es propio para el valor propio 1. 

DEMOSTRACION. Si se sigue el metodo anterior se tiene: Det(I - XI) = (1 - A) n luego 1 es 
el unico valor propio y el espacio nulo es R n , es decir una base del espacio nulo de A — XI esta 
formada por cualquier conjunto de n vectores LI de R n . □ 

8.1.3. Matrices de Proyeccion. 

Teorema. Si P es una matriz de proyeccion entonces cualquier vector del espacio de las columnas de P 
es un vector propio asociado al valor propio 1 y cualquier vector del espacio nulo de P es un vector propio 
asociado al valor propio 0. 

DEMOSTRACION. Una matriz de proyeccion P produce la proyeccion de un vector c sobre su 
espacio de las columnas. Si c esta en el espacio de las columnas Pc = c. Para cualquier vector d 
que sea ortogonal al espacio de las columnas (es decir, que este en el espacio nulo) su proyeccion 
es el vector cero y d es un vector propio asociado al valor propio cero. Pd = 0 = Od. 

Ningun otro vector es propio ya que P siempre los va a proyectar sobre el espacio de las columnas. 



8.1.4. Inversas. 

Teorema. Si A es invertible, A' 1 tiene los mismos vectores propios y sus valores propios son los inversos 
de los valores propios de A. 

DEMOSTRACION. Sea v un vector propio de la matriz invertible A. Entonces Av = Xv. Enton- 



Teorema. Si A tiene n vectores propios linealmente independientes entonces es diagonalizable. 
DEMOSTRACION. Sea S la matriz cuyas columnas son los vectores propios de A. 



□ 



ces v = 



A^ 1 Xv y A^v = X^v. 



□ 



8.2. Forma Diagonal 



S = [ vi v 2 




S es no singular por ser vectores LI, luego existe su inversa S . Entonces si A es la matriz diagonal 
formada por los valores propios se cumple: 



8.3. APLICACIONES 
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AS = A[ v 1 v 2 v n ] = [ Xivi X 2 v 2 X n v n ] = [v\ v 2 v n ] 



Ai 0 

0 A 2 

0 ... 

0 ... 



0 
0 
0 

An 



Ai 


0 


0 


0 


0 


A 2 




0 


0 






0 


0 




0 


An 



AS = SA donde A 



Es decir: S^AS = AoA = SAS' 1 . 

Teorema. Si los valores propios X±, X 2 , ■ ■ ■ ,X n son todos distintos entonces {v±, v 2 , 
linealmente independiente. 

A continuacion se dara una demostracion para el caso de dimension 2. 



□ 

, v n } es 



Demostracion. Supongase que 
(8.2.1) civi + c 2 v 2 = 0 

con c\ y c 2 distintos de cero. 
Multiplicando la expresion 8.2.1 por A queda 



(8.2.2) A{c\v\ + c 2 v 2 ) = c\Av\ + c 2 Av 2 = ciAi^i + c 2 X 2 v 2 = 0 

Restando 8.2.2 menos X 2 veces 8.2.1 queda 

(8.2.3) ci«i(Ai-A 2 ) = 0 

Si ci es distinto de cero, entonces X\ — X 2 debe ser cero, lo cual es una contradiccion porque por 
hipotesis Ai y X 2 son diferentes. 

El mismo analisis se extiende a dimensiones mayores: se asume que existe una combinacion lineal 
que produce ceros, se multiplica por A, se le resta menos A„ veces la combinacion original y queda 
una combinacion de los vectores v\, v 2 , ■ ■ ■ , v n -\ que produce cero. Repitiendo los mismos pasos 
progresivamente se llega a un multiplo de v\ que produce cero (como en 8.2.3). Esto fuerza que c\ 
y todos los Cj deben ser cero. □ 



8.3. Aplicaciones 

8.3.1. Potencias de una matriz. Si A = SAS ~ l entonces A n = SA^S" 1 . 
Por ejemplo, para n = 2, A 2 = SAS^SAS' 1 = SA 2 S- 1 
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8.3.1.1. Numeros de Fibonacci. F n+ i = F n + F n _i, F 0 = 0, F± = 1 
Podemos plantear el sistema de ecuaciones: 



Sea U n 

U n +i = 
\J n= AU n - X 



F n -i 

1 1 
1 0 



, entonces U\ 



U n = AU n 



n+l 



F — F 

1 n — L n 



F n + F n _i 



1 

0 



yU, 



n+l 



F 



n+l 



Nos queda 



U 2 = AUx 

Entonces ?7 ra +i = A n U\. 

8.3.1.2. Problema de Poblacion. Supongase que de EEUU sale cada ano el 20 % de su poblacion 
e ingresa el 10 % del resto del mundo. Sea y poblacion fuera, y x poblacion dentro. 

x n +i = 0,8x n + 0,ly n 

y n+ i = 0,2x n + 0,9y n 



SiU„ 



Vr, 



, entonces 



U, 



n+l 



0,8 0,1 
0,2 0,9 



U„ 



U n+1 = A n U x 
Los valores propios de la matriz A son las rakes de 

(0,8 - A)(0,9 - A) - 0,1 x 0,2 = A 2 - 1,7A + 0,7 



0,8 -A 0,1 
0,2 0,9 - A 



Las raices son Ai = 1 y A2 = 0,7. Los vectores propios asociados son 
mente. 

" 1 1 



" 1 ' 




1 " 


2 


y 


-1 



La matriz de vectores propios es S = 
diagonal de valores propios es A 

Como A n = SA n S~ 1 , U n+1 



2 -1 
1 0 
0 0,7 



y su mversa es 



1 


" 1 1 " 




" 1™ 0 




" 1 1 " 


3 


2 -1 




0 0,7™ 




2 -1 



c-l _ 1 

* -3 



C/i. 



1 

2 



, respectiva- 



La matriz 



Para valores grandes de n , 



1 



n+l 





1 


0 




1 


1 




Xl 






0 


0 




2 


-1 




yi 





k(xi+yi) 
3(^1+2/1) 



Notese que a largo plazo, si se mantiene la tendencia, un tercio de toda la poblacion estara en 
EEUU y dos tercios en el resto del mundo, sin importar la proporcion inicial. 
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8.4. Matrices simetricas 

Teorema. Si A es simetrica entonces sus valores propios son reales. 

DEMOSTRACION. Sea v un valor propio de A. Entonces 

(8.4.1) \\Av\\ 2 = {AvfAv = v T A T Av = v T A 2 v 

Como v es un valor propio Av = Xv y 

(8.4.2) A 2 v = AAv = AXv = XAv = X 2 v 
Sustituyendo 8.4.1 en 8.4.2 queda \\Av\\ 2 = v T X 2 v = X 2 v T v = X 2 \\v\\ 2 , de donde 

X 2 = 



v2 \\M\ 2 



I I- 
\v\\ 



Claramente, A 2 es un numero real positivo. Si A es un complejo de la forma a + bi, entonces A 2 = 
a 2 — b 2 — 2abi. Esta expresion solo puede ser real positiva cuando b = 0 y por lo tanto A es un 
numero real. □ 

Teorema. Si los valores propios de una matrix simetrica A son distintos, entonces los vectores propios 
correspondientes son ortogonales. 

DEMOSTRACION. Sean Ai y A2 dos valores propios cualesquiera de A y sean xyy sus corres- 
pondientes vectores propios tales que Ax = X\x y Ay = A22/. 

Multiplicando por y T y x T queda 

(8.4.3) y T Ax = y T X x x = X x y T x 

y 

(8.4.4) x T Ay = x T X 2 y = X 2 x T y 



Trasponiendo la ultima expresion queda 

(8.4.5) y T Ax = X 2 y T x 

Igualando 8.4.3 y 8.4.5 queda X\y T x = X 2 y T x, lo cual equivale a 

(8.4.6) y T x(X 1 - A 2 ) = 0 

Como Ai y A2 son diferentes, entonces y T x debe ser cero y por lo tanto xyy son ortogonales. □ 

COROLARIO. Una transformacion sobre una base ortogonal de vectores propios se expresa como una dila- 
tacion en cada direccion ortogonal 

(n \ n n 

k=i / k=i k=i 

COROLARIO. Si los Vj se toman ortonormales entonces S T = S^ 1 luego, A = SAS T . 
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8.5. Formas cuadraticas 
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DEFINICION. Una forma cuadratica F(x) es una funcion de varias variables, -de las variables que 
forman el vector x- que es suma de monomios de segundo grado: 

n n 

F(x) = ^] CLijXiXj 
i=l j=l 



esta funcion se expresa sinteticamente asl: 



F(x) = x T Ax 



donde los elementos fuera de la diagonal son la mitad de los coeficientes de XiXj 
EjEMPLO. F(x, y, z) = 2x 2 + Axy + y 2 + 3z 2 - 6yz entonces: 



A 



2 2 0 
2 1 -3 
0-3 3 



Notese que A es simetrica. 



8.5.1. Gradiente de una forma cuadratica. El gradiente de una funcion F es el vector de las 
derivadas parciales de F respecto de las xf 



VF(x) 



dF 

8x2 



dF 



F(x) = x T Ax -» VF(x) = 2Ax 
Notas: 

■ para las formas lineales F(x) = b T x su gradiente es VF(x) = b 

■ para las funciones de segundo grado completas: 

F(x) = x T Ax + b T x + c^ VF{x) = 2Ax + b 



8.5.2. Positividad de una matriz. La matriz simetrica A es: 

■ definida positiva si F(x) = x T Ax > 0 \/x / 0 

■ semidefinida positiva si F(x) = x T Ax > 0 ^ 0 

■ definida negativa si F(x) = x 1 Ax < 0 Vx / 0 

■ semidefinida negativa si F(x) = x 1 Ax < 0 Vx / 0 
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8.5.3. Analisis de las formas cuadraticas. Se probara a continuacion que el conocimiento de 
los vectores y valores propios de una matriz simetrica A permite determinar si la forma cuadratica 
F(x) = x T Ax asociada es de alguno de los tipos anteriormente enunciados. 

Previamente, se caracteriza la transformacion A y su forma cuadratica asociada usando como base 
del espacio el conjunto de vectores propios. 

Se formara una base ortonormal de vectores propios vi,....,v n . Cada vector del espacio es una CL 
de esta base, luego: 

Si x = CjVj entonces Ax = Y c jAvj = Y c jXjVj, es decir, Ax se obtiene simplemente de la CL 
de los vectores dilatados por su valor propio asociado. En cuanto a la forma cuadratica: 



F(x) = x T Ax = (J2 CkVk)(Y^ c j X j v j) = c i A J 



Notese que: 



Si todos los valores propios son positivos F(x) es definida positiva 

Si todos los valores propios son positivos o nulos F(x) es semidefinida positiva 

Si todos los valores propios son negativos F{x) es definida negativa 

Si todos los valores propios son negativos o nulos F(x) es semidefinida negativa 

Si existe al menos un positivo y un negativo F(x) toma valores de distinto signo 



Si los vectores propios, Vj, no son de norma 1 el resultado es: 

F(x) = x T Ax = c kvl)02 c i Vi) = Yl c i A i 



y no cambia la interpretacion de la forma cuadratica ya que su signo sigue dependiendo de los 
valores propios asociados a la matriz. 

8.5.3.1. Curvas de nivel. ^Cuando es F(x) = x 7 Ax = constante? Si se expresa x T Ax = 
Y cjXj = constante , se determina entonces el punto de corte de la curva de nivel con los ejes de- 
finidos por los vectores propios. Si todos los Xj son positivos la curva de nivel es un elipsoide, es 
decir una elipse generalizada. Para los vectores sobre el eje Vj, x = CjVj, F(x) = cjXj = constante 

, entonces 



co nstante 
A, 



. El eje mayor de la elipse corresponde al menor valor propio, ya que 
al menor Xj le corresponde el mayor Cj. 

EjEMPLO. SeaF(x) = 2xf +4x1X2+3x1 +4x|— 4^2X3 la forma cuadratica que en notacion matricial 

es F(x) = x T Ax con 



A 



2 2 0 
2 3-2 
0-2 4 



A tiene por matriz de vectores propios 



y valores propios 



A 



2 2 _ 1 
33 3 



0 0 0 
0 3 0 
0 0 6 
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luego, la forma cuadratica es semidefinida positiva y vale estrictamente 0 para cualquier vector 
colineal con 



Vl 



por ejemplo: 



3 

-4 



CAPiTULO 9 



EXTREMOS DE FUNCIONES DE VARIAS VARIABLES 



Los candidatos a extremos de una funcion diferenciable de varias variables deben buscarse entre 
los puntos estacionarios de la funcion: es decir, donde su gradiente VF(x) es nulo. Entonces un 
estudio de extremos se inicia resolviendo el sistema: 

VF(x) = 0 

Supongase que una de las soluciones de la ecuacion anterior es xo- La nulidad del gradiente no 
garantiza que F tenga un maximo o un mmimo en el punto xo; luego, es necesario una apro- 
ximacion de segundo orden en el punto para determinar el comportamiento de la funcion. Esta 
aproximacion la da el siguiente teorema. 



9.1. Teorema de Taylor 



(9.1.1) F(x) = F(x 0 ) + (x - x 0 ) T V F(x 0 ) + ^(x - xo) t H(x 0 )(x - x 0 ) + e ||(x - x 0 )|| 2 

con e un infinitesimo en% 

La condicion de estacionaridad, \/F(xq) = 0, implica que el comportamiento en el punto depende 
de la forma cuadratica (x — xq) t H(xq)(x - x 0 ) que se analiza a traves de su positividad. 

H(F(x)) es el hessiano de F(x) y es una matriz simetrica constituida por todas las segundas 
derivadas parciales. 



EjEMPLO. F(x, y) = 7 + 2(x + y) 2 - y sin y - x 3 en (0, 0) 

El gradiente de F(x,y) es ., ^\ y ) ^ X 

° [ 4(x + y) — siny — y cosy 

por lo tanto es un punto estacionario. 

4 - 6x 4 

4 4 — 2 cos y + y sin y 





' d 2 F 


d 2 F 


d 2 F 


d 2 F 




dx'f 


dx\dx2 


dxidx3 


dxidx„ 




d 2 F 


d 2 F 


d 2 F 


d 2 F 


H(F(x)) = 




dx'i 


8x28x3 


dx2dx n 




d 2 F 


d 2 F 


8 2 F 


d 2 F 




dx-ndxi 


dx n dx2 


8x„8x3 


dx„dXn 



En el punto (0, 0) el gradiente es nulo y 



El hessiano H es 



. En el punto (0, 0) el hessiano vale 



4 4 
4 2 



Para calcular los valores propios del hessiano basta resolver det(H — IX) que es (4 — A) (2 — A) — 
16 = A 2 — 6A — 8. Este polinomio tiene una raiz positiva y una negativa (recordar que el termino 
independiente es igual al producto de las raices y al ser negativo es producto de un valor positivo 
y uno negativo) y por lo tanto la matriz es indefinida y el punto (0, 0) es un punto de silla, como 
se observa en la Figura 9.1.1. 
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7.5 




-0.5 0.4 0.2 



FlGURA 9.1.1. Grafica de la funcion F(x, y) = 7 + 2(x + y) 2 — y sin y — x 3 



EjEMPLO. F(x, z) = 2x 2 z 2 -4z - Ax en (1, 1) 

Axz 2 - 4 
4x 2 z - 4 



El gradiente es 
El hessiano H es 



. En (1, 1) el gradiente es nulo y por lo tanto es un punto estacionario. 



4z 2 8xz 
8xz 4x 2 



. En (1, 1) el hessiano es 



4 8 
8 4 



Para calcular los valores propios se resuelve el polinomio caracteristico (4 - A) 2 — 64 = A 2 — 8A — 48. 
En este caso tambien hay una ralz positiva y una negativa (las raices son 12 y —4) y por lo tanto 
(1, 1) es un punto de silla, como se observa en la Figura 9.1.2. 



EjEMPLO. F(x,y) = xe x cosy en (— 1,0) 
e x cos y + xe x cos y 



El gradiente es 
estacionario. 

El hessiano es 



— xe sin y 



. En (—1, 0) el gradiente es nulo y por lo tanto es un punto 



2e x cos y + xe x cos y — e x siny — xe x siny 



-e x siny — xe x siny 



-xe cos y 



. En (-1, 0) el hessiano es 



e- 1 0 
0 e 



Para calcular los valores propios se resuelve el polinomio caracteristico (e 1 — A) (e — A). En este 
caso ambas raices son positivas y por lo tanto (— 1, 0) es un mmimo, como se observa en la Figura 
9.1.3. 

EjEMPLO. F(x, y) = (x - y) 2 + x 3 en (0, 0) 
2(x -y) + 3x 2 



El gradiente es 
cionario. 

El hessiano es 



2{y - x) 

2 + 6x -2 
-2 2 



. En (0, 0) el gradiente es nulo y por lo tanto es un punto esta- 



. En (0, 0) el hessiano es 



2 -2 
-2 2 
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-2- 



-3 




FlGURA 9.1.2. Grafica de la funcion F(x, z) = 2x 2 z 2 - \z - \x 




FlGURA 9.1.3. Grafica de F(x,y) = xe x cosy 

Para calcular los valores propios se resuelve el polinomio caracteristico (2 — A) 2 — 4. En este caso 
las ralces son 0 y 4, es decir, la matriz es semidefinida positiva y no se puede determinar si (0, 0) 
es mmimo, maximo o punto de silla. Se sabe que no puede ser maximo porque la funcion crece 
en la direccion asociada al valor propio 4, que en este caso corresponde al vector propio (— 1, l) 1 , 
pero no se puede indicar que se trata de un minimo porque en este caso el termino infinitesimal 



Notese que la direccion donde crece la funcion es con respecto al punto estacionario. Por ejemplo, si el punto 
estacionario hubiese sido (3, 2) en lugar de (0, 0) la direccion seria en funcion de (2, 2) y no de (0, 0), es decir, seria la 
direccion de la recta que pasa por los puntos (4, 3) y (3, 2). 
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200- 
150 - 
100- 
50 : 
0- 
-50 : 
-100- 




FlGURA 9.1.4. Grafica de F(x,y) = (x - y) 2 + x 3 

que normalmente se desprecia en la aproximacion dada por el teorema de Taylor ya no se puede 
despreciar. 

La Figura 9.1.4 muestra que el punto (0, 0) es realmente un punto de silla, pero eso no se puede 
determinar a partir del vector propio asociado al valor propio 0. 

Sustituyendo el punto x 0 = (0, 0) y los valores de la funcion, gradiente y hessiano en ecuacion 
9.1.1, la aproximacion de Taylor para F es 

F(x) = \[x y] 

F(x) = x 2 - 2xy + y 2 + e = (x - y) 2 + e 

Como puede verse, el efecto del termino de tercer orden es despreciado en la aproximacion dada 
por el teorema de Taylor y su influencia se desconoce en el caso del valor propio 0. 

En este caso, se puede determinar el valor del termino e mediante el analisis de la diferencia entre 
F(x) y la aproximacion cuadratica. En este caso, e = (x — y) 2 + x 3 — (x — y) 2 = x 3 , la cual representa 
un punto de inflexion en el punto (0, 0). Recordar que en una funcion de una variable, suponiendo 
que la primera derivada distinta de cero es de orden n, si n es par se trata de un extremo (si 
el signo es positivo indica un mmimo y negativo indica maximo) y si n es impar se trata de un 
punto de inflexion. En este caso la primera derivada distinta de cero es la tercera derivada, ya que 
e'(x) = 3x 2 = 0, e"(x) = 6x = 0 y e"'(x) = 6 y por lo tanto en (0, 0) F(x) tiene un punto de silla. 




x 

y 



+ e 



CAPiTULO 10 



DESCOMPOSICION EN VALORES SINGULARES (SVD) 



10.1. Introduction 



Cualquier matriz A mxn puede ser factorizada 

(10.1.1) A = UZV T 

donde U, V son ortogonales y £ mxn solo tiene elementos positivos o nulos en su diagonal. 

Los elementos oi de la diagonal de £ estan ordenados de forma decreciente y los ultimos n - r 
terminos son cero. Estos valores reciben el nombre de valores singulares y cumplen 

(10.1.2) Avi = ami 

Donde los v\ y los Uj son las columnas de V y U respectivamente. 

La matriz U es una base ortonormal para R m , la matriz V es una base ortonormal para M n y 
geometricamente puede interpretarse la matriz A como una transformation de un vector x del 
espacio M m a W 1 en la cual cada componente de x en la base V tiene asociada una dilatation en 
cada componente de la base U. El valor singular indica el factor de la dilatation. 

De 10.1.1, 



A = [U\U2 ■ ■ ■ u r 



Or, 



T 
T 



entonces 



A 



o\U\ a 2 u 2 



aiuivf + aiuivj" + 



+ a r u r vj 



(10.1.3) A = UZV T = a i u i v I 

i=i 

Notese que los Oi estan ordenados decrecientemente y que cada Ui y vi es normalizado, entonces 
a medida que i aumenta, la influencia de OiUivJ sobre el valor de A disminuye. 
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10.2. Aplicacion a compresion de datos 

El resultado anterior puede utilizarse en aplicaciones de compresion de datos en las cuales se 
puede aproximar el valor de A utilizando los primeros h elementos de la sumatoria 10.1.3. La 
ventaja de este enfoque radica en el hecho de que una matriz que requiere mn numeros puede ser 
representada de manera aproximada utilizando h + mh + nh = h(l + m + n) numeros, lo cual 
puede representar una reduccion significativa en el tamano de los datos. 

Por ejemplo, una imagen en escala de grises puede ser representada mediante una matriz donde 
cada elemento representa el color (por ejemplo, 0 negro y 255 bianco) 1 de cada pixel 2 . Por ejem- 
plo, una imagen de 1000 x 1000 pixels requiere un millon de valores para ser representada, pero 
utilizando los primeros 100 valores singulares podria obtenerse una muy buena aproximacion y 
se requeririan unicamente 100(1 + 1000 + 1000) = 200100 valores lo cual representarla una com- 
presion de casi el 80 %. 

10.3. Construccion de la SVD 

Supongase que se tiene una matriz rectangular A de m x n. Entonces, la matriz simetrica A T A de 
n x n tiene un conjunto de vectores propios ortonormales xi,X2,-" i x n- Este conjunto de vectores 
es una base de W 1 y constituiran las columnas de la matriz V. 



(10.3.1) A T Axj = XjXj con xjxj = 1 y xjxj = 0 para i ^ j 

Si se calcula el producto escalar con Xj se obtiene 

(10.3.2) xjA T Axj = Xjxjxj 
de donde 

(10.3.3) \\Ax j \\ 2 = X j 
por lo tanto Xj > 0. 

Supongase que se decide organizar los Xj y Xj de manera tal que los Xj esten ordenados de manera 
decreciente. En este caso se puede asumir que los primeros r valores propios son positivos y que 
los ultimos n — r son cero. 

Para los Xj > 0 sean 

(10.3.4) Oj = \f~X~j y qj = Axjjoj 

Estos qj son vectores unitarios (segun ecuacion 10.3.3, cr^es la norma de Axj) y ortogonales en M. m . 
Segun las ecuaciones 10.3.1 y 10.3.2: 

(10.3.5) qjqj = X J^^1 = = 0 

OiOj OiOj 

Estos r vectores ortonormales qj pueden ser extendidos (de ser necesario) a m vectores ortonor- 
males mediante el procedimiento de Gram-Schmidt, formando asi una base de W n . Estos vectores 
9i, <Z2, • • ■ , 9 m seran las columnas de la matriz V. 

Considerese ahora el producto S = U T AV. El elemento en la posicion i, j de este producto es 

qjAxj. 



^una imagen a color suele ser representada mediante tres matrices conteniendo cada una la intensidad de los 
colores rojo, verde y azul. 

Pixel: picture element o elemento de imagen. 
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(10.3.6) <ljA Xj = \ T ° ^j>rpot q neA Xj = 0 

y ql crjqj si j < r porque Axj = Ujqj 

Pero qjqj = 0 excepto en el caso i = j, en cuyo caso es 1. Entonces, las unicas entradas distintas 
de cero en la matriz S = U T AV son los primeros r elementos de la diagonal, los cuales son 
o"i, (72, ■ ■ ■ ,a r . Como U y V son ortogonales entonces 

A = UT,V T 



